<!DOCTYPE HTML>
<html lang="zh-CN">


<head>
    <meta charset="utf-8">
    <meta name="keywords" content="论文精读——Learning to Prompt for Vision-Language Models, J Sir">
    <meta name="description" content="">
    <meta http-equiv="X-UA-Compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1.0, user-scalable=no">
    <meta name="renderer" content="webkit|ie-stand|ie-comp">
    <meta name="mobile-web-app-capable" content="yes">
    <meta name="format-detection" content="telephone=no">
    <meta name="apple-mobile-web-app-capable" content="yes">
    <meta name="apple-mobile-web-app-status-bar-style" content="black-translucent">
    <!-- Global site tag (gtag.js) - Google Analytics -->


    <title>论文精读——Learning to Prompt for Vision-Language Models | J Sir</title>
    <link rel="icon" type="image/png" href="/favicon.png">

    <link rel="stylesheet" type="text/css" href="/libs/awesome/css/all.css">
    <link rel="stylesheet" type="text/css" href="/libs/materialize/materialize.min.css">
    <link rel="stylesheet" type="text/css" href="/libs/aos/aos.css">
    <link rel="stylesheet" type="text/css" href="/libs/animate/animate.min.css">
    <link rel="stylesheet" type="text/css" href="/libs/lightGallery/css/lightgallery.min.css">
    <link rel="stylesheet" type="text/css" href="/css/matery.css">
    <link rel="stylesheet" type="text/css" href="/css/my.css">

    <script src="/libs/jquery/jquery.min.js"></script>

<meta name="generator" content="Hexo 6.0.0">
<style>.github-emoji { position: relative; display: inline-block; width: 1.2em; min-height: 1.2em; overflow: hidden; vertical-align: top; color: transparent; }  .github-emoji > span { position: relative; z-index: 10; }  .github-emoji img, .github-emoji .fancybox { margin: 0 !important; padding: 0 !important; border: none !important; outline: none !important; text-decoration: none !important; user-select: none !important; cursor: auto !important; }  .github-emoji img { height: 1.2em !important; width: 1.2em !important; position: absolute !important; left: 50% !important; top: 50% !important; transform: translate(-50%, -50%) !important; user-select: none !important; cursor: auto !important; } .github-emoji-fallback { color: inherit; } .github-emoji-fallback img { opacity: 0 !important; }</style>
</head>




<body>
    <header class="navbar-fixed">
    <nav id="headNav" class="bg-color nav-transparent">
        <div id="navContainer" class="nav-wrapper container">
            <div class="brand-logo">
                <a href="/" class="waves-effect waves-light">
                    
                    <img src="/medias/logo.png" class="logo-img" alt="LOGO">
                    
                    <span class="logo-span">J Sir</span>
                </a>
            </div>
            

<a href="#" data-target="mobile-nav" class="sidenav-trigger button-collapse"><i class="fas fa-bars"></i></a>
<ul class="right nav-menu">
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/" class="waves-effect waves-light">
      
      <i class="fas fa-home" style="zoom: 0.6;"></i>
      
      <span>首页</span>
    </a>
    
  </li>
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/tags" class="waves-effect waves-light">
      
      <i class="fas fa-tags" style="zoom: 0.6;"></i>
      
      <span>标签</span>
    </a>
    
  </li>
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/categories" class="waves-effect waves-light">
      
      <i class="fas fa-bookmark" style="zoom: 0.6;"></i>
      
      <span>分类</span>
    </a>
    
  </li>
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/archives" class="waves-effect waves-light">
      
      <i class="fas fa-archive" style="zoom: 0.6;"></i>
      
      <span>归档</span>
    </a>
    
  </li>
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/about" class="waves-effect waves-light">
      
      <i class="fas fa-user-circle" style="zoom: 0.6;"></i>
      
      <span>关于</span>
    </a>
    
  </li>
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/contact" class="waves-effect waves-light">
      
      <i class="fas fa-comments" style="zoom: 0.6;"></i>
      
      <span>留言板</span>
    </a>
    
  </li>
  
  <li class="hide-on-med-and-down nav-item">
    
    <a href="/friends" class="waves-effect waves-light">
      
      <i class="fas fa-address-book" style="zoom: 0.6;"></i>
      
      <span>友情链接</span>
    </a>
    
  </li>
  
  <li>
    <a href="#searchModal" class="modal-trigger waves-effect waves-light">
      <i id="searchIcon" class="fas fa-search" title="搜索" style="zoom: 0.85;"></i>
    </a>
  </li>
</ul>


<div id="mobile-nav" class="side-nav sidenav">

    <div class="mobile-head bg-color">
        
        <img src="/medias/logo.png" class="logo-img circle responsive-img">
        
        <div class="logo-name">J Sir</div>
        <div class="logo-desc">
            
            Never really desperate, only the lost of the soul.
            
        </div>
    </div>

    

    <ul class="menu-list mobile-menu-list">
        
        <li class="m-nav-item">
	  
		<a href="/" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-home"></i>
			
			首页
		</a>
          
        </li>
        
        <li class="m-nav-item">
	  
		<a href="/tags" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-tags"></i>
			
			标签
		</a>
          
        </li>
        
        <li class="m-nav-item">
	  
		<a href="/categories" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-bookmark"></i>
			
			分类
		</a>
          
        </li>
        
        <li class="m-nav-item">
	  
		<a href="/archives" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-archive"></i>
			
			归档
		</a>
          
        </li>
        
        <li class="m-nav-item">
	  
		<a href="/about" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-user-circle"></i>
			
			关于
		</a>
          
        </li>
        
        <li class="m-nav-item">
	  
		<a href="/contact" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-comments"></i>
			
			留言板
		</a>
          
        </li>
        
        <li class="m-nav-item">
	  
		<a href="/friends" class="waves-effect waves-light">
			
			    <i class="fa-fw fas fa-address-book"></i>
			
			友情链接
		</a>
          
        </li>
        
        
        <li><div class="divider"></div></li>
        <li>
            <a href="https://github.com/jy741" class="waves-effect waves-light" target="_blank">
                <i class="fab fa-github-square fa-fw"></i>Fork Me
            </a>
        </li>
        
    </ul>
</div>


        </div>

        
            <style>
    .nav-transparent .github-corner {
        display: none !important;
    }

    .github-corner {
        position: absolute;
        z-index: 10;
        top: 0;
        right: 0;
        border: 0;
        transform: scale(1.1);
    }

    .github-corner svg {
        color: #0f9d58;
        fill: #fff;
        height: 64px;
        width: 64px;
    }

    .github-corner:hover .octo-arm {
        animation: a 0.56s ease-in-out;
    }

    .github-corner .octo-arm {
        animation: none;
    }

    @keyframes a {
        0%,
        to {
            transform: rotate(0);
        }
        20%,
        60% {
            transform: rotate(-25deg);
        }
        40%,
        80% {
            transform: rotate(10deg);
        }
    }
</style>

<a href="https://github.com/jy741" class="github-corner tooltipped hide-on-med-and-down" target="_blank"
   data-tooltip="Fork Me" data-position="left" data-delay="50">
    <svg viewBox="0 0 250 250" aria-hidden="true">
        <path d="M0,0 L115,115 L130,115 L142,142 L250,250 L250,0 Z"></path>
        <path d="M128.3,109.0 C113.8,99.7 119.0,89.6 119.0,89.6 C122.0,82.7 120.5,78.6 120.5,78.6 C119.2,72.0 123.4,76.3 123.4,76.3 C127.3,80.9 125.5,87.3 125.5,87.3 C122.9,97.6 130.6,101.9 134.4,103.2"
              fill="currentColor" style="transform-origin: 130px 106px;" class="octo-arm"></path>
        <path d="M115.0,115.0 C114.9,115.1 118.7,116.5 119.8,115.4 L133.7,101.6 C136.9,99.2 139.9,98.4 142.2,98.6 C133.8,88.0 127.5,74.4 143.8,58.0 C148.5,53.4 154.0,51.2 159.7,51.0 C160.3,49.4 163.2,43.6 171.4,40.1 C171.4,40.1 176.1,42.5 178.8,56.2 C183.1,58.6 187.2,61.8 190.9,65.4 C194.5,69.0 197.7,73.2 200.1,77.6 C213.8,80.2 216.3,84.9 216.3,84.9 C212.7,93.1 206.9,96.0 205.4,96.6 C205.1,102.4 203.0,107.8 198.3,112.5 C181.9,128.9 168.3,122.5 157.7,114.1 C157.9,116.9 156.7,120.9 152.7,124.9 L141.0,136.5 C139.8,137.7 141.6,141.9 141.8,141.8 Z"
              fill="currentColor" class="octo-body"></path>
    </svg>
</a>
        
    </nav>

</header>

    



<div class="bg-cover pd-header post-cover" style="background-image: url('/medias/featureimages/13.jpg')">
    <div class="container" style="right: 0px;left: 0px;">
        <div class="row">
            <div class="col s12 m12 l12">
                <div class="brand">
                    <h1 class="description center-align post-title">论文精读——Learning to Prompt for Vision-Language Models</h1>
                </div>
            </div>
        </div>
    </div>
</div>




<main class="post-container content">

    
    <link rel="stylesheet" href="/libs/tocbot/tocbot.css">
<style>
    #articleContent h1::before,
    #articleContent h2::before,
    #articleContent h3::before,
    #articleContent h4::before,
    #articleContent h5::before,
    #articleContent h6::before {
        display: block;
        content: " ";
        height: 100px;
        margin-top: -100px;
        visibility: hidden;
    }

    #articleContent :focus {
        outline: none;
    }

    .toc-fixed {
        position: fixed;
        top: 64px;
    }

    .toc-widget {
        width: 345px;
        padding-left: 20px;
    }

    .toc-widget .toc-title {
        padding: 35px 0 15px 17px;
        font-size: 1.5rem;
        font-weight: bold;
        line-height: 1.5rem;
    }

    .toc-widget ol {
        padding: 0;
        list-style: none;
    }

    #toc-content {
        padding-bottom: 30px;
        overflow: auto;
    }

    #toc-content ol {
        padding-left: 10px;
    }

    #toc-content ol li {
        padding-left: 10px;
    }

    #toc-content .toc-link:hover {
        color: #42b983;
        font-weight: 700;
        text-decoration: underline;
    }

    #toc-content .toc-link::before {
        background-color: transparent;
        max-height: 25px;

        position: absolute;
        right: 23.5vw;
        display: block;
    }

    #toc-content .is-active-link {
        color: #42b983;
    }

    #floating-toc-btn {
        position: fixed;
        right: 15px;
        bottom: 76px;
        padding-top: 15px;
        margin-bottom: 0;
        z-index: 998;
    }

    #floating-toc-btn .btn-floating {
        width: 48px;
        height: 48px;
    }

    #floating-toc-btn .btn-floating i {
        line-height: 48px;
        font-size: 1.4rem;
    }
</style>
<div class="row">
    <div id="main-content" class="col s12 m12 l9">
        <!-- 文章内容详情 -->
<div id="artDetail">
    <div class="card">
        <div class="card-content article-info">
            <div class="row tag-cate">
                <div class="col s7">
                    
                    <div class="article-tag">
                        
                            <a href="/tags/%E6%9C%9F%E5%88%8A%E8%AE%BA%E6%96%87/">
                                <span class="chip bg-color">期刊论文</span>
                            </a>
                        
                            <a href="/tags/%E6%8F%90%E7%A4%BA%E5%AD%A6%E4%B9%A0/">
                                <span class="chip bg-color">提示学习</span>
                            </a>
                        
                    </div>
                    
                </div>
                <div class="col s5 right-align">
                    
                </div>
            </div>

            <div class="post-info">
                
                <div class="post-date info-break-policy">
                    <i class="far fa-calendar-minus fa-fw"></i>发布日期:&nbsp;&nbsp;
                    2023-05-04
                </div>
                

                

                
                <div class="info-break-policy">
                    <i class="far fa-file-word fa-fw"></i>文章字数:&nbsp;&nbsp;
                    5.1k
                </div>
                

                

                
                    <div id="busuanzi_container_page_pv" class="info-break-policy">
                        <i class="far fa-eye fa-fw"></i>阅读次数:&nbsp;&nbsp;
                        <span id="busuanzi_value_page_pv"></span>
                    </div>
				
            </div>
        </div>
        <hr class="clearfix">

        
        <!-- 是否加载使用自带的 prismjs. -->
        <link rel="stylesheet" href="/libs/prism/prism.css">
        

        

        <div class="card-content article-card-content">
            <div id="articleContent">
                <h2 id="摘要"><a href="#摘要" class="headerlink" title="摘要"></a>摘要</h2><p>2022 IJCV</p>
<p>像 CLIP 这样的大型预训练视觉语言模型在学习表征方面显示出巨大潜力，这些表征可以在广泛的下游任务中迁移。与传统的主要基于离散化标签的表示学习不同，视觉语言预训练将图像和文本对齐在一个共同的特征空间中，这允许通过提示将零样本迁移到下游任务，即分类权重是从自然语言中合成的描述感兴趣的类。</p>
<p>在实践中部署此类模型的一个主要挑战是提示工程（Prompt Engineering），这需要领域专业知识并且非常耗时——需要花费大量时间进行文字调整，因为措辞的微小变化可能会影响对性能的巨大影响。受自然语言处理 (NLP) 提示学习研究的最新进展启发，我们提出了上下文优化 (CoOp)，这是一种专门用于为下游图像识别调整 CLIP-like 视觉语言模型的简单方法。</p>
<p>具体来说，CoOp 使用可学习向量对提示的上下文词进行建模，同时整个预训练参数保持固定。为了处理不同的图像识别任务，我们提供了 CoOp 的两种实现：统一上下文和类特定上下文。</p>
<h2 id="引言"><a href="#引言" class="headerlink" title="引言"></a>引言</h2><p>构建最先进的视觉识别系统的一种常见方法是训练视觉模型，使用离散标签预测一组固定的对象类别。尽管训练类别通常具有文本形式，如“金鱼”或“卫生纸”，但它们将被转换为离散标签，只是为了简化交叉熵损失的计算，从而使文本中封装的语义在很大程度上未被利用。这样的学习范式将视觉识别系统限制为闭集视觉概念，使得它们无法处理新的类别，因为学习新的分类器需要额外的数据。</p>
<p>CLIP 和 ALIGN 等视觉语言预训练已成为视觉表征学习的有前途的替代方案。主要思想是使用两个独立的编码器对齐图像和原始文本——每个编码器对应一个模态。例如，CLIP 和 ALIGN 都将学习目标制定为对比损失，它将图像及其文本描述拉到一起，同时推开特征空间中不匹配的对。通过大规模的预训练，模型可以学习不同的视觉概念，并且可以很容易地通过提示转移到任何下游任务。</p>
<p>在预训练的视觉语言模型中，文本输入（称为提示）在下游数据集中起着关键作用。但识别正确的提示是一项非常重要的任务，通常需要花费大量时间来调整单词——措辞上的微小变化可能会对性能产生巨大影响。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507152559243.png" alt="image-20230507152559243"></p>
<p>如上图，对于Caltech101(a)在类标记前添加“a”可使准确率提高 5% 以上。此外，提示工程还需要有关任务的先验知识，理想情况下还需要语言模型的底层机制。这在图 1(b-d) 中得到了例证，例如，在 Flowers102 的类标记之后放置“a type of flower”，在 DTD 的上下文中仅保留“texture”，并在 EuroSAT 的“satellite photo”之前添加“centered”。然而，即使进行了大量调整，也不能保证生成的提示对于这些下游任务是最佳的。</p>
<p>受近期自然语言处理 (NLP) 提示学习研究的启发，我们提出了一种称为上下文优化 (CoOp) 的简单方法来实现自动化提示工程，专门用于预训练的视觉语言模型。</p>
<p>具体而言，CoOp 使用可学习向量对提示的上下文词进行建模，这些向量可以使用随机值或预训练词嵌入进行初始化。提供了两种实现来处理不同性质的任务：一种是基于统一上下文，它与所有类共享相同的上下文，并且在大多数类别上都能很好地工作；而另一种是基于类特定的上下文，它为每个类学习一组特定的上下文标记，并且被发现更适合一些细粒度的类别。</p>
<p>为了证明 CoOp 的有效性，我们对 11 个数据集进行了基准测试，这些数据集涵盖了一组不同的视觉识别任务，包括对通用对象、场景、动作和细粒度类别的分类，以及识别纹理和卫星图像等专门任务。结果表明，CoOp 有效地将预训练的视觉语言模型转变为数据高效的视觉学习器，只需一两个样本即可以相当大的优势击败手工制作的提示。CoOp 还优于线性探针模型，后者被称为强大的少样本学习基线。</p>
<p>此外，尽管 CoOp 是一种基于学习的方法，但它比零样本（zero-shot）模型（使用手动提示）对域转移表现出更强的鲁棒性。</p>
<p>本文主要贡献如下：</p>
<ol>
<li>我们及时研究了最近提出的视觉语言模型在下游应用程序中的适应性，并确定了与部署效率相关的关键问题，即提示工程。</li>
<li>为了专门针对预训练视觉语言模型自动化提示工程，我们提出了一种基于持续提示学习的简单方法，并提供了两种可以处理不同识别任务的实现。</li>
<li>我们首次表明，就大型视觉语言模型在域转换下的下游迁移学习性能和鲁棒性而言，所提出的基于提示学习的方法优于手工提示和线性探测模型。</li>
<li>代码开源：<a target="_blank" rel="noopener" href="https://github.com/kaiyangzhou/coop">https://github.com/kaiyangzhou/coop</a></li>
</ol>
<h2 id="相关工作"><a href="#相关工作" class="headerlink" title="相关工作"></a>相关工作</h2><h3 id="视觉语言模型"><a href="#视觉语言模型" class="headerlink" title="视觉语言模型"></a>视觉语言模型</h3><p>视觉语言模型最近在学习通用视觉表示和通过提示允许零镜头迁移到各种下游分类任务方面显示出巨大潜力。</p>
<p>视觉语言学习的最新发展，特别是 CLIP（Radford 等人，2021）和 ALIGN（Jia 等人，2021），主要是由以下三个领域的进步推动的：</p>
<ul>
<li>使用 Transformers 学习文本表示</li>
<li>大批量对比表示学习</li>
<li>大规模的训练数据集——CLIP 受益于 4 亿个精选的图像文本对，而 ALIGN 利用 18 亿个嘈杂的图像文本对</li>
</ul>
<p>我们的工作与视觉语言模型的近期研究正交，旨在促进此类模型在下游数据集中的适应和部署。</p>
<h3 id="NLP中的提示学习"><a href="#NLP中的提示学习" class="headerlink" title="NLP中的提示学习"></a>NLP中的提示学习</h3><p>知识探索的基本思想是诱导预训练的语言模型在给定完形填空式提示的情况下生成答案（BERT），这有利于许多下游任务，例如情感分析。</p>
<p>与我们的工作最相关的是持续提示的学习方法，它优化词嵌入空间中的连续向量。与搜索离散标记相比，此类方法的一个缺点是缺乏一种清晰的方法来可视化为向量学习了哪些“单词”。</p>
<p>我们率先将即时学习应用于计算机视觉中大型视觉语言模型的适配——并证明了提示学习不仅在迁移学习性能方面为计算机视觉任务带来了显着改进，而且还产生了可以处理域转换的强大模型。</p>
<h3 id="方法"><a href="#方法" class="headerlink" title="方法"></a>方法</h3><h3 id="视觉-语言预训练"><a href="#视觉-语言预训练" class="headerlink" title="视觉-语言预训练"></a>视觉-语言预训练</h3><p>我们的方法适用于更广泛的类 CLIP 视觉语言模型。因此简要介绍视觉语言预训练，特别是 CLIP。</p>
<h4 id="模型结构"><a href="#模型结构" class="headerlink" title="模型结构"></a>模型结构</h4><p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507155230899.png" alt="image-20230507155230899"></p>
<p>CLIP的主要结构是一个文本编码器Text Encoder和一个图像编码器Image Encoder，然后计算文本向量和图像向量的相似度以预测它们是否为一对。</p>
<p>CLIP将图像和文本先分别输入一个图像编码器image_encoder和一个文本编码器text_encoder，得到图像和文本的向量表示 I-f 和 T_f 。然后将图像和文本的向量表示映射到一个joint multimodal sapce，得到新的可直接进行比较的图像和文本的向量表示 I_e 和T_e （这是多模态学习中常用的一种方法，不同模态的数据表示之间可能存在gap，无法进行直接的比较，因此先将不同模态的数据映射到同一个多模态空间，有利于后续的相似度计算等操作）。然后计算图像向量和文本向量之间的cosine相似度。最后，对比学习的目标函数就是让正样本对的相似度较高，负样本对的相似度较低。</p>
<h4 id="训练"><a href="#训练" class="headerlink" title="训练"></a>训练</h4><p>CLIP 被训练来对齐分别为图像和文本学习的两个嵌入空间。具体来说，学习目标被表述为对比损失。给定一批图像-文本对，CLIP 最大化匹配对的余弦相似度，同时最小化所有其他不匹配对的余弦相似度。</p>
<h4 id="零样本推理"><a href="#零样本推理" class="headerlink" title="零样本推理"></a>零样本推理</h4><p>CLIP预训练时使用的数据集是WIT，这意味着CLIP在训练时没有见过ImageNet这些数据集中的图像，那么这种测试实际上就是zero shot的。</p>
<p>假设要测试的数据集是ImageNet，那么，因为CLIP在训练时用的所有数据来自WIT，而没有任何ImageNet的数据，所以CLIP在ImageNet上进行测试实际上就是Zero shot的。由于ImageNet中text数据只有表示图像类别的car，dog，bird等single word，而CLIP训练时text数据是sentence，为了弥补训练和测试的gap，作者将ImageNet中所有类别单词扩展为一句话“ A photo of a {car/dog/…/bird}. ” ，作为图像对应的sentence（该操作实际上是prompt engineering）。</p>
<p>形式上，令 f 为图像编码器为图像 x 提取的图像特征，${w<em>i}^K</em>{i=1} $为文本编码器生成的一组权重向量，K 表示类别的数量。</p>
<p>计算预测概率为</p>
<script type="math/tex; mode=display">
p(y=i|x)= \frac{exp(cos(w_i,f)/τ)}{\sum_{j=1}^K exp(cos(w_j,f)/τ}</script><p>其中 τ 是 CLIP 学习的温度参数，cos(·,·) 表示余弦相似度。</p>
<p>与从随机向量中学习闭集视觉概念的传统分类器学习方法相比，视觉语言预训练允许通过高容量文本编码器探索开集视觉概念，从而导致更广泛的语义空间和转而使学习到的表示更易于转移到下游任务。</p>
<h3 id="上下文优化"><a href="#上下文优化" class="headerlink" title="上下文优化"></a>上下文优化</h3><p>我们提出了上下文优化 (CoOp)，它通过使用从数据中端到端学习的连续向量对上下文词进行建模来避免手动提示调整，同时大量预训练参数被冻结。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507160424105.png" alt="image-20230507160424105"></p>
<h4 id="统一上下文"><a href="#统一上下文" class="headerlink" title="统一上下文"></a>统一上下文</h4><p>统一上下文版本，它与所有类共享相同的上下文。具体来说，给文本编码器g(·)的提示设计成如下形式：</p>
<script type="math/tex; mode=display">
t = [V]_1[V]_2…[V]_M[CLASS]</script><p>每个$ [V]_m $是一个与词嵌入维度相同的向量，M 是一个超参数，指定上下文标记的数量。</p>
<p>通过将提示 t 转发给文本编码器 g(·)，我们可以获得表示视觉概念的分类权重向量，预测概率计算为</p>
<script type="math/tex; mode=display">
p(y=i|x)= \frac{exp(cos(g(t_i),f)/τ)}{\sum_{j=1}^K exp(cos(g(t_j),f)/τ}</script><p>提示t除了上述设计，也可以放在中间，如$t = [V]<em>1…[V]</em>\frac{M}{2}[CLASS]…[V]_M$，这增加了学习的灵活性——提示可以用补充描述填充后面的单元格，或者通过使用句号等终止信号提前中断句子。</p>
<h4 id="类特定上下文"><a href="#类特定上下文" class="headerlink" title="类特定上下文"></a>类特定上下文</h4><p>另一种选择是设计类特定上下文 (CSC)，其中上下文向量独立于每个类。作为统一上下文的替代方案，我们发现 CSC 对于一些细粒度分类任务特别有用。</p>
<p>基于交叉熵进行训练以最小化标准分类损失，并且梯度可以通过文本编码器g(·)一路反向传播，利用参数中编码的丰富知识来优化上下文.连续表示的设计还允许在词嵌入空间中进行充分探索，这有助于学习与任务相关的上下文。</p>
<h3 id="讨论"><a href="#讨论" class="headerlink" title="讨论"></a>讨论</h3><p>我们的方法与 NLP 中为语言模型开发的提示学习方法有一些区别。首先，类似于 CLIP 的模型和语言模型的骨干架构明显不同——前者将视觉和文本数据作为输入并生成用于图像识别的对齐分数，而后者专门用于处理文本数据。其次，预训练目标不同：对比学习与自回归学习。这将导致不同的模型行为，因此需要不同的模块设计。</p>
<h2 id="实验"><a href="#实验" class="headerlink" title="实验"></a>实验</h2><h3 id="少样本学习"><a href="#少样本学习" class="headerlink" title="少样本学习"></a>少样本学习</h3><p>我们遵循 CLIP中采用的少样本评估协议，分别使用 1、2、4、8 和 16 样本进行训练，并在完整测试集中部署模型。</p>
<p>CoOp 有四个版本：将类标记放在最后或中间；统一上下文与 CSC。</p>
<p>训练细节：图像特征提取器Backbone——ResNet-50，上下文标记的数量 M 设置为 16。CoOp 的上下文向量通过从标准差等于 0.02 的零均值高斯分布中抽取而随机初始化。训练是使用 SGD 和 0.002 的初始学习率完成的，该学习率通过余弦退火规则衰减。为了减轻在早期训练迭代中观察到的爆炸性梯度，我们使用热身技巧，仅在第一个时期将学习率固定为 1e-5。</p>
<p>我们将 CoOp 与两种基线方法进行比较：</p>
<p>第一个是零样本 CLIP，它基于手工制作的提示。对于一般的物体和场景，提示采用“a photo of a [CLASS]”，对于细粒度的类别，添加任务相关的上下文。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507194331893.png" alt="image-20230507194331893"></p>
<p>第二个基线是线性探针模型。遵循 Radford 等人使用的相同训练方法训练线性探针模型。</p>
<p>下图为11 个数据集上的小样本学习的主要结果。总体而言，CoOp 有效地将 CLIP 转变为强大的少样本学习器（实线），与零样本 CLIP（星号）相比实现了显着改进，并且优于线性探测替代方案（虚线）。 M 表示上下文长度。 “end”或“mid”表示将类标记放在末尾或中间。 CSC 表示特定于类的上下文。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507194435134.png" alt="image-20230507194435134"></p>
<p>我们观察到 CLIP+CoOp 是一个强大的少样本学习器，平均只需要两次样本就可以获得比零样本 CLIP 更可观的利润。给定 16 个样本进行训练，CoOp 带来的平均差距可以进一步提高到 15% 左右。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507194636684.png" alt="image-20230507194636684"></p>
<p>平均而言，使用统一上下文会带来更好的性能。关于什么时候申请CSC，什么时候不申请，我们有以下建议。对于通用对象 (ImageNet &amp; Caltech101)、场景 (SUN397) 和动作 (UCF101)，使用统一上下文显然更好。统一上下文在一些细粒度数据集上也能更好地工作，包括 OxfordPets 和 Food101，但在 StanfordCars、Flowers102 和 FGVCAircraft 等其他数据集上，CSC 版本是首选。然而，CSC 在具有挑战性的低数据场景（少于 8 个样本）中大多表现不及统一上下文，这是有道理的，因为 CSC 的参数比统一上下文多，需要更多数据进行训练。</p>
<h3 id="域泛化"><a href="#域泛化" class="headerlink" title="域泛化"></a>域泛化</h3><p>由于 CoOp 需要针对特定数据分布进行训练，因此它冒着学习虚假相关的风险，这些虚假相关不利于未见分布（域）中的泛化。相反，零样本 CLIP 不依赖于特定的数据分布，并且对分布变化表现出很强的鲁棒性 。</p>
<p>源数据集是 ImageNet。目标数据集是 ImageNetV2、ImageNet-Sketch、ImageNet-A  和 ImageNetR ，具有与 ImageNet 兼容的类名，允许无缝传输 CoOp 学习到的提示。</p>
<p>与使用不同视觉主干的零镜头 CLIP 对分布偏移的鲁棒性进行比较：</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507195127516.png" alt="image-20230507195127516"></p>
<p>令人惊讶的是，尽管暴露了源数据集，但 CoOp 增强了 CLIP 对分布变化的稳健性。这表明学习到的提示也是可概括的。此外，有趣的是，使用更少的上下文标记会带来更好的鲁棒性。相比之下，线性探针模型在这些目标数据集上获得的结果要差得多，暴露出其在领域泛化方面的弱点。</p>
<h3 id="更深入的分析"><a href="#更深入的分析" class="headerlink" title="更深入的分析"></a>更深入的分析</h3><p>应该使用多少上下文标记？从上面我们可以得出具有较短的上下文长度有利于域泛化（可能是由于学习的参数较少，因此过度拟合较少）。</p>
<p>我们研究源数据集的这个超参数。我们通过将上下文长度从 4 更改为 8 再到 16，在 11 个数据集上重复实验。</p>
<p>结果如上图，可以看出拥有更多的上下文标记会带来更好的性能，并且将类标记放在中间会随着上下文长度的增加而获得更大的动力。总而言之，选择完美的上下文长度没有黄金法则，因为需要在性能和分布偏移的稳健性之间取得平衡。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507195501249.png" alt="image-20230507195501249"></p>
<p>我们对Vision Backbones也做了分析：</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507195535122.png" alt="image-20230507195535122"></p>
<p>预期结果：主干越高级，性能越好。 CoOp 和手工提示之间的差距在所有架构中都很明显。</p>
<p>与使用不同视觉主干的 ImageNet 上的提示工程和提示集成进行比较：</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507195709601.png" alt="image-20230507195709601"></p>
<p>我们将随机初始化与手动初始化进行比较。后者使用“a photo of a”的嵌入来初始化 11 个数据集的上下文向量。为了公平比较，我们在使用随机初始化时也将上下文长度设置为 4。结果表明“良好”的初始化并没有太大区别。</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507195813771.png" alt="image-20230507195813771"></p>
<p>解释提示学习很困难，因为上下文向量在连续空间中进行了优化。我们通过在词汇表中搜索最接近基于欧几里得距离的学习向量的单词来采用间接方式。</p>
<p>CoOp 学习的 16 个上下文向量中每一个的最近单词，它们的距离显示在括号中。 N/A 表示非拉丁字符：</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507200057364.png" alt="image-20230507200057364"></p>
<p>我们还观察到，当使用手动初始化时（如“a photo of a”），收敛向量最近的词大多是用于初始化的词。我们推测学习到的向量可能会编码超出现有词汇表的含义。总的来说，我们无法根据观察得出任何确定的结论，因为使用最近的词来解释学习到的提示可能是不准确的——向量的语义不一定与最近的词相关。</p>
<p>我们进一步将 CoOp 与其他微调方法进行了比较：</p>
<p><img src="https://pluto-1300780100.cos.ap-nanjing.myqcloud.com/img/image-20230507200222665.png" alt="image-20230507200222665"></p>
<p>显然，微调图像编码器效果不佳。添加一个转换层略微改进了零样本模型。添加偏差项显示出有希望的结果，但在很大程度上仍低于 CoOp，这表明通过文本编码器的梯度提供了更有用的信息。</p>
<h2 id="总结"><a href="#总结" class="headerlink" title="总结"></a>总结</h2><p>大型预训练视觉语言模型在各种下游应用程序中显示出惊人的强大功能。然而，这些模型也被称为视觉基础模型，因为它们需要使用自动化技术进行调整，以提高下游性能和效率。</p>
<p>我们的研究提供了关于如何通过使用提示学习将 CLIP-like 模型转变为数据高效学习器的及时见解，并表明尽管是一种基于学习的方法，但 CoOp 在领域泛化方面的表现要比手动提示好得多。</p>
<p>尽管性能出色，但 CoOp 的结果相对难以解释，就像 NLP 中的其他持续提示学习方法一样。</p>

                
            </div>
            <hr/>

            

    <div class="reprint" id="reprint-statement">
        
            <div class="reprint__author">
                <span class="reprint-meta" style="font-weight: bold;">
                    <i class="fas fa-user">
                        文章作者:
                    </i>
                </span>
                <span class="reprint-info">
                    <a href="/about" rel="external nofollow noreferrer">J Sir</a>
                </span>
            </div>
            <div class="reprint__type">
                <span class="reprint-meta" style="font-weight: bold;">
                    <i class="fas fa-link">
                        文章链接:
                    </i>
                </span>
                <span class="reprint-info">
                    <a href="https://jy741.gitee.io/2023/05/04/lun-wen-jing-du-learning-to-prompt-for-vision-language-models/">https://jy741.gitee.io/2023/05/04/lun-wen-jing-du-learning-to-prompt-for-vision-language-models/</a>
                </span>
            </div>
            <div class="reprint__notice">
                <span class="reprint-meta" style="font-weight: bold;">
                    <i class="fas fa-copyright">
                        版权声明:
                    </i>
                </span>
                <span class="reprint-info">
                    本博客所有文章除特別声明外，均采用
                    <a href="https://creativecommons.org/licenses/by/4.0/deed.zh" rel="external nofollow noreferrer" target="_blank">CC BY 4.0</a>
                    许可协议。转载请注明来源
                    <a href="/about" target="_blank">J Sir</a>
                    !
                </span>
            </div>
        
    </div>

    <script async defer>
      document.addEventListener("copy", function (e) {
        let toastHTML = '<span>复制成功，请遵循本文的转载规则</span><button class="btn-flat toast-action" onclick="navToReprintStatement()" style="font-size: smaller">查看</a>';
        M.toast({html: toastHTML})
      });

      function navToReprintStatement() {
        $("html, body").animate({scrollTop: $("#reprint-statement").offset().top - 80}, 800);
      }
    </script>



            <div class="tag_share" style="display: block;">
                <div class="post-meta__tag-list" style="display: inline-block;">
                    
                        <div class="article-tag">
                            
                                <a href="/tags/%E6%9C%9F%E5%88%8A%E8%AE%BA%E6%96%87/">
                                    <span class="chip bg-color">期刊论文</span>
                                </a>
                            
                                <a href="/tags/%E6%8F%90%E7%A4%BA%E5%AD%A6%E4%B9%A0/">
                                    <span class="chip bg-color">提示学习</span>
                                </a>
                            
                        </div>
                    
                </div>
                <div class="post_share" style="zoom: 80%; width: fit-content; display: inline-block; float: right; margin: -0.15rem 0;">
                    <link rel="stylesheet" type="text/css" href="/libs/share/css/share.min.css">
<div id="article-share">

    
    <div class="social-share" data-sites="twitter,facebook,google,qq,qzone,wechat,weibo,douban,linkedin" data-wechat-qrcode-helper="<p>微信扫一扫即可分享！</p>"></div>
    <script src="/libs/share/js/social-share.min.js"></script>
    

    

</div>

                </div>
            </div>
            
                <style>
    #reward {
        margin: 40px 0;
        text-align: center;
    }

    #reward .reward-link {
        font-size: 1.4rem;
        line-height: 38px;
    }

    #reward .btn-floating:hover {
        box-shadow: 0 6px 12px rgba(0, 0, 0, 0.2), 0 5px 15px rgba(0, 0, 0, 0.2);
    }

    #rewardModal {
        width: 320px;
        height: 350px;
    }

    #rewardModal .reward-title {
        margin: 15px auto;
        padding-bottom: 5px;
    }

    #rewardModal .modal-content {
        padding: 10px;
    }

    #rewardModal .close {
        position: absolute;
        right: 15px;
        top: 15px;
        color: rgba(0, 0, 0, 0.5);
        font-size: 1.3rem;
        line-height: 20px;
        cursor: pointer;
    }

    #rewardModal .close:hover {
        color: #ef5350;
        transform: scale(1.3);
        -moz-transform:scale(1.3);
        -webkit-transform:scale(1.3);
        -o-transform:scale(1.3);
    }

    #rewardModal .reward-tabs {
        margin: 0 auto;
        width: 210px;
    }

    .reward-tabs .tabs {
        height: 38px;
        margin: 10px auto;
        padding-left: 0;
    }

    .reward-content ul {
        padding-left: 0 !important;
    }

    .reward-tabs .tabs .tab {
        height: 38px;
        line-height: 38px;
    }

    .reward-tabs .tab a {
        color: #fff;
        background-color: #ccc;
    }

    .reward-tabs .tab a:hover {
        background-color: #ccc;
        color: #fff;
    }

    .reward-tabs .wechat-tab .active {
        color: #fff !important;
        background-color: #22AB38 !important;
    }

    .reward-tabs .alipay-tab .active {
        color: #fff !important;
        background-color: #019FE8 !important;
    }

    .reward-tabs .reward-img {
        width: 210px;
        height: 210px;
    }
</style>

<div id="reward">
    <a href="#rewardModal" class="reward-link modal-trigger btn-floating btn-medium waves-effect waves-light red">赏</a>

    <!-- Modal Structure -->
    <div id="rewardModal" class="modal">
        <div class="modal-content">
            <a class="close modal-close"><i class="fas fa-times"></i></a>
            <h4 class="reward-title">你的赏识是我前进的动力</h4>
            <div class="reward-content">
                <div class="reward-tabs">
                    <ul class="tabs row">
                        <li class="tab col s6 alipay-tab waves-effect waves-light"><a href="#alipay">支付宝</a></li>
                        <li class="tab col s6 wechat-tab waves-effect waves-light"><a href="#wechat">微 信</a></li>
                    </ul>
                    <div id="alipay">
                        <img src="/medias/reward/alipay.jpg" class="reward-img" alt="支付宝打赏二维码">
                    </div>
                    <div id="wechat">
                        <img src="/medias/reward/wechat.png" class="reward-img" alt="微信打赏二维码">
                    </div>
                </div>
            </div>
        </div>
    </div>
</div>

<script>
    $(function () {
        $('.tabs').tabs();
    });
</script>

            
        </div>
    </div>

    

    

    

    

    

    

    

    

<article id="prenext-posts" class="prev-next articles">
    <div class="row article-row">
        
        <div class="article col s12 m6" data-aos="fade-up">
            <div class="article-badge left-badge text-color">
                <i class="fas fa-chevron-left"></i>&nbsp;上一篇</div>
            <div class="card">
                <a href="/2023/05/08/ti-shi-xue-xi-prompt-learning/">
                    <div class="card-image">
                        
                        
                        <img src="/medias/featureimages/6.jpg" class="responsive-img" alt="提示学习Prompt Learning">
                        
                        <span class="card-title">提示学习Prompt Learning</span>
                    </div>
                </a>
                <div class="card-content article-content">
                    <div class="summary block-with-text">
                        
                            
                        
                    </div>
                    <div class="publish-info">
                        <span class="publish-date">
                            <i class="far fa-clock fa-fw icon-date"></i>2023-05-08
                        </span>
                        <span class="publish-author">
                            
                            <i class="fas fa-user fa-fw"></i>
                            J Sir
                            
                        </span>
                    </div>
                </div>
                
                <div class="card-action article-tags">
                    
                    <a href="/tags/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/">
                        <span class="chip bg-color">机器学习</span>
                    </a>
                    
                    <a href="/tags/%E6%8F%90%E7%A4%BA%E5%AD%A6%E4%B9%A0/">
                        <span class="chip bg-color">提示学习</span>
                    </a>
                    
                </div>
                
            </div>
        </div>
        
        
        <div class="article col s12 m6" data-aos="fade-up">
            <div class="article-badge right-badge text-color">
                下一篇&nbsp;<i class="fas fa-chevron-right"></i>
            </div>
            <div class="card">
                <a href="/2023/04/22/lun-wen-jing-du-textattack-openattack/">
                    <div class="card-image">
                        
                        
                        <img src="/medias/featureimages/1.jpg" class="responsive-img" alt="论文精读——TextAttack&amp;&amp;OpenAttack">
                        
                        <span class="card-title">论文精读——TextAttack&amp;&amp;OpenAttack</span>
                    </div>
                </a>
                <div class="card-content article-content">
                    <div class="summary block-with-text">
                        
                            TextAttack原文标题：《TextAttack: A Framework for Adversarial Attacks, Data Augmentation, and Adversarial Training in NLP》
202
                        
                    </div>
                    <div class="publish-info">
                            <span class="publish-date">
                                <i class="far fa-clock fa-fw icon-date"></i>2023-04-22
                            </span>
                        <span class="publish-author">
                            
                            <i class="fas fa-user fa-fw"></i>
                            J Sir
                            
                        </span>
                    </div>
                </div>
                
                <div class="card-action article-tags">
                    
                    <a href="/tags/%E5%AF%B9%E6%8A%97%E6%94%BB%E5%87%BB/">
                        <span class="chip bg-color">对抗攻击</span>
                    </a>
                    
                    <a href="/tags/%E6%9C%9F%E5%88%8A%E8%AE%BA%E6%96%87/">
                        <span class="chip bg-color">期刊论文</span>
                    </a>
                    
                </div>
                
            </div>
        </div>
        
    </div>
</article>

</div>



<!-- 代码块功能依赖 -->
<script type="text/javascript" src="/libs/codeBlock/codeBlockFuction.js"></script>

<!-- 代码语言 -->

<script type="text/javascript" src="/libs/codeBlock/codeLang.js"></script>


<!-- 代码块复制 -->

<script type="text/javascript" src="/libs/codeBlock/codeCopy.js"></script>


<!-- 代码块收缩 -->

<script type="text/javascript" src="/libs/codeBlock/codeShrink.js"></script>


    </div>
    <div id="toc-aside" class="expanded col l3 hide-on-med-and-down">
        <div class="toc-widget card" style="background-color: white;">
            <div class="toc-title"><i class="far fa-list-alt"></i>&nbsp;&nbsp;目录</div>
            <div id="toc-content"></div>
        </div>
    </div>
</div>

<!-- TOC 悬浮按钮. -->

<div id="floating-toc-btn" class="hide-on-med-and-down">
    <a class="btn-floating btn-large bg-color">
        <i class="fas fa-list-ul"></i>
    </a>
</div>


<script src="/libs/tocbot/tocbot.min.js"></script>
<script>
    $(function () {
        tocbot.init({
            tocSelector: '#toc-content',
            contentSelector: '#articleContent',
            headingsOffset: -($(window).height() * 0.4 - 45),
            collapseDepth: Number('0'),
            headingSelector: 'h1, h2, h3, h4, h5'
        });

        // modify the toc link href to support Chinese.
        let i = 0;
        let tocHeading = 'toc-heading-';
        $('#toc-content a').each(function () {
            $(this).attr('href', '#' + tocHeading + (++i));
        });

        // modify the heading title id to support Chinese.
        i = 0;
        $('#articleContent').children('h1, h2, h3, h4, h5').each(function () {
            $(this).attr('id', tocHeading + (++i));
        });

        // Set scroll toc fixed.
        let tocHeight = parseInt($(window).height() * 0.4 - 64);
        let $tocWidget = $('.toc-widget');
        $(window).scroll(function () {
            let scroll = $(window).scrollTop();
            /* add post toc fixed. */
            if (scroll > tocHeight) {
                $tocWidget.addClass('toc-fixed');
            } else {
                $tocWidget.removeClass('toc-fixed');
            }
        });

        
        /* 修复文章卡片 div 的宽度. */
        let fixPostCardWidth = function (srcId, targetId) {
            let srcDiv = $('#' + srcId);
            if (srcDiv.length === 0) {
                return;
            }

            let w = srcDiv.width();
            if (w >= 450) {
                w = w + 21;
            } else if (w >= 350 && w < 450) {
                w = w + 18;
            } else if (w >= 300 && w < 350) {
                w = w + 16;
            } else {
                w = w + 14;
            }
            $('#' + targetId).width(w);
        };

        // 切换TOC目录展开收缩的相关操作.
        const expandedClass = 'expanded';
        let $tocAside = $('#toc-aside');
        let $mainContent = $('#main-content');
        $('#floating-toc-btn .btn-floating').click(function () {
            if ($tocAside.hasClass(expandedClass)) {
                $tocAside.removeClass(expandedClass).hide();
                $mainContent.removeClass('l9');
            } else {
                $tocAside.addClass(expandedClass).show();
                $mainContent.addClass('l9');
            }
            fixPostCardWidth('artDetail', 'prenext-posts');
        });
        
    });
</script>

    

</main>


<script src="https://cdn.bootcss.com/mathjax/2.7.5/MathJax.js?config=TeX-AMS-MML_HTMLorMML"></script>
<script>
    MathJax.Hub.Config({
        tex2jax: {inlineMath: [['$', '$'], ['\(', '\)']]}
    });
</script>



    <footer class="page-footer bg-color">
    
        <link rel="stylesheet" href="/libs/aplayer/APlayer.min.css">
<style>
    .aplayer .aplayer-lrc p {
        
        display: none;
        
        font-size: 12px;
        font-weight: 700;
        line-height: 16px !important;
    }

    .aplayer .aplayer-lrc p.aplayer-lrc-current {
        
        display: none;
        
        font-size: 15px;
        color: #42b983;
    }

    
    .aplayer.aplayer-fixed.aplayer-narrow .aplayer-body {
        left: -66px !important;
    }

    .aplayer.aplayer-fixed.aplayer-narrow .aplayer-body:hover {
        left: 0px !important;
    }

    
</style>
<div class="">
    
    <div class="row">
        <meting-js class="col l8 offset-l2 m10 offset-m1 s12"
                   server="netease"
                   type="playlist"
                   id="503838841"
                   fixed='true'
                   autoplay='false'
                   theme='#42b983'
                   loop='all'
                   order='random'
                   preload='auto'
                   volume='0.7'
                   list-folded='true'
        >
        </meting-js>
    </div>
</div>

<script src="/libs/aplayer/APlayer.min.js"></script>
<script src="https://cdn.jsdelivr.net/npm/meting@2/dist/Meting.min.js"></script>

    
    <div class="container row center-align" style="margin-bottom: 0px !important;">
        <div class="col s12 m8 l8 copy-right">
            Copyright&nbsp;&copy;
            
                <span id="year">2020-2023</span>
            
            <span id="year">2020</span>
            <a href="/about" target="_blank">J Sir</a>
            |&nbsp;Powered by&nbsp;<a href="https://hexo.io/" target="_blank">Hexo</a>
            |&nbsp;Theme&nbsp;<a href="https://github.com/blinkfox/hexo-theme-matery" target="_blank">Matery</a>
            <br>
            
            &nbsp;<i class="fas fa-chart-area"></i>&nbsp;站点总字数:&nbsp;<span
                class="white-color">300.9k</span>&nbsp;字
            
            
            
            
            
            
            <span id="busuanzi_container_site_pv">
                |&nbsp;<i class="far fa-eye"></i>&nbsp;总访问量:&nbsp;<span id="busuanzi_value_site_pv"
                    class="white-color"></span>&nbsp;次
            </span>
            
            
            <span id="busuanzi_container_site_uv">
                |&nbsp;<i class="fas fa-users"></i>&nbsp;总访问人数:&nbsp;<span id="busuanzi_value_site_uv"
                    class="white-color"></span>&nbsp;人
            </span>
            
            <br>
            
            <br>
            
        </div>
        <div class="col s12 m4 l4 social-link social-statis">


    <a href="mailto:2065373132@qq.com" class="tooltipped" target="_blank" data-tooltip="邮件联系我" data-position="top" data-delay="50">
        <i class="fas fa-envelope-open"></i>
    </a>







    <a href="tencent://AddContact/?fromId=50&fromSubId=1&subcmd=all&uin=2065373132" class="tooltipped" target="_blank" data-tooltip="QQ联系我: 2065373132" data-position="top" data-delay="50">
        <i class="fab fa-qq"></i>
    </a>







    <a href="/atom.xml" class="tooltipped" target="_blank" data-tooltip="RSS 订阅" data-position="top" data-delay="50">
        <i class="fas fa-rss"></i>
    </a>

</div>
    </div>
</footer>

<div class="progress-bar"></div>


    <!-- 搜索遮罩框 -->
<div id="searchModal" class="modal">
    <div class="modal-content">
        <div class="search-header">
            <span class="title"><i class="fas fa-search"></i>&nbsp;&nbsp;搜索</span>
            <input type="search" id="searchInput" name="s" placeholder="请输入搜索的关键字"
                   class="search-input">
        </div>
        <div id="searchResult"></div>
    </div>
</div>

<script type="text/javascript">
$(function () {
    var searchFunc = function (path, search_id, content_id) {
        'use strict';
        $.ajax({
            url: path,
            dataType: "xml",
            success: function (xmlResponse) {
                // get the contents from search data
                var datas = $("entry", xmlResponse).map(function () {
                    return {
                        title: $("title", this).text(),
                        content: $("content", this).text(),
                        url: $("url", this).text()
                    };
                }).get();
                var $input = document.getElementById(search_id);
                var $resultContent = document.getElementById(content_id);
                $input.addEventListener('input', function () {
                    var str = '<ul class=\"search-result-list\">';
                    var keywords = this.value.trim().toLowerCase().split(/[\s\-]+/);
                    $resultContent.innerHTML = "";
                    if (this.value.trim().length <= 0) {
                        return;
                    }
                    // perform local searching
                    datas.forEach(function (data) {
                        var isMatch = true;
                        var data_title = data.title.trim().toLowerCase();
                        var data_content = data.content.trim().replace(/<[^>]+>/g, "").toLowerCase();
                        var data_url = data.url;
                        data_url = data_url.indexOf('/') === 0 ? data.url : '/' + data_url;
                        var index_title = -1;
                        var index_content = -1;
                        var first_occur = -1;
                        // only match artiles with not empty titles and contents
                        if (data_title !== '' && data_content !== '') {
                            keywords.forEach(function (keyword, i) {
                                index_title = data_title.indexOf(keyword);
                                index_content = data_content.indexOf(keyword);
                                if (index_title < 0 && index_content < 0) {
                                    isMatch = false;
                                } else {
                                    if (index_content < 0) {
                                        index_content = 0;
                                    }
                                    if (i === 0) {
                                        first_occur = index_content;
                                    }
                                }
                            });
                        }
                        // show search results
                        if (isMatch) {
                            str += "<li><a href='" + data_url + "' class='search-result-title'>" + data_title + "</a>";
                            var content = data.content.trim().replace(/<[^>]+>/g, "");
                            if (first_occur >= 0) {
                                // cut out 100 characters
                                var start = first_occur - 20;
                                var end = first_occur + 80;
                                if (start < 0) {
                                    start = 0;
                                }
                                if (start === 0) {
                                    end = 100;
                                }
                                if (end > content.length) {
                                    end = content.length;
                                }
                                var match_content = content.substr(start, end);
                                // highlight all keywords
                                keywords.forEach(function (keyword) {
                                    var regS = new RegExp(keyword, "gi");
                                    match_content = match_content.replace(regS, "<em class=\"search-keyword\">" + keyword + "</em>");
                                });

                                str += "<p class=\"search-result\">" + match_content + "...</p>"
                            }
                            str += "</li>";
                        }
                    });
                    str += "</ul>";
                    $resultContent.innerHTML = str;
                });
            }
        });
    };

    searchFunc('/search.xml', 'searchInput', 'searchResult');
});
</script>

    <!-- 回到顶部按钮 -->
<div id="backTop" class="top-scroll">
    <a class="btn-floating btn-large waves-effect waves-light" href="#!">
        <i class="fas fa-arrow-up"></i>
    </a>
</div>


    <script src="/libs/materialize/materialize.min.js"></script>
    <script src="/libs/masonry/masonry.pkgd.min.js"></script>
    <script src="/libs/aos/aos.js"></script>
    <script src="/libs/scrollprogress/scrollProgress.min.js"></script>
    <script src="/libs/lightGallery/js/lightgallery-all.min.js"></script>
    <script src="/js/matery.js"></script>

    <!-- Baidu Analytics -->

    <!-- Baidu Push -->

<script>
    (function () {
        var bp = document.createElement('script');
        var curProtocol = window.location.protocol.split(':')[0];
        if (curProtocol === 'https') {
            bp.src = 'https://zz.bdstatic.com/linksubmit/push.js';
        } else {
            bp.src = 'http://push.zhanzhang.baidu.com/push.js';
        }
        var s = document.getElementsByTagName("script")[0];
        s.parentNode.insertBefore(bp, s);
    })();
</script>

    
    <script src="/libs/others/clicklove.js" async="async"></script>
    
    
    <script async src="/libs/others/busuanzi.pure.mini.js"></script>
    

    

    

	
    

    

    

    
    <script src="/libs/instantpage/instantpage.js" type="module"></script>
    

<script src="/live2dw/lib/L2Dwidget.min.js?094cbace49a39548bed64abff5988b05"></script><script>L2Dwidget.init({"pluginRootPath":"live2dw/","pluginJsPath":"lib/","pluginModelPath":"assets/","tagMode":false,"debug":false,"model":{"jsonPath":"live2d-widget-model-hibiki"},"display":{"position":"right","width":145,"height":315},"mobile":{"show":true,"scale":0.5},"react":{"opacityDefault":0.7,"opacityOnHover":0.8},"log":false});</script></body>

</html>
